\section{Google Panda Update und die Auswirkungen auf den Deutschen Bildungsserver}
\gaetzke
\label{sec:panda_update}
Zu Beginn des letzten Jahres sorgte ein Algorithmusupdate der wohl populärsten Suchmaschine für zahlreiche Diskussionen innerhalb der SEO-Fachkreise. Das unter dem Codenamen ``Panda'' bekannte Update war eine Qualitätsoffensive von Google in Richtung hochwertiger Suchergebnisse innerhalb der Trefferliste. Neben zahlreichen Vorteilen für Google-Benutzer, brachte das Panda-Update eine Vielzahl von betroffenen Webseiten hervor, die nicht selten zu Unrecht abgestraft wurden. Im Folgenden werden die Hintergründe und die Auswirkungen des Updates beleuchtet und mit der Webseite des Deutschen Bildungsservers in Zusammenhang gebracht. Darüber hinaus werden Gegenmaßnahmen präsentiert und am Beispiel einer betroffen Webseite veranschaulicht.


\subsection{Hintergrund und weitere Google-Updates seit 2011}

Im Februar 2011 präsentierte Google unter dem Codenamen ``Panda'' ein neues Update, das zunächst auf den amerikanischen Raum begrenzt in Wirkung trat. Trotz der mehreren Hundert Aktualisierungen, die jährlich an dem Suchalgorithmus der wohl bekanntesten Suchmaschine unternommen werden, sorgt das Panda-Update bis heute für zahlreiche Diskussionen in den Fachkreisen der Suchmaschinenoptimierer. Zur Bekämpfung von Webspam initiiert, führte das Update zu zahlreichen Gewinnern, die von den veränderten Rankingregeln profitierten, aber auch zu zahlreichen Verlierern, die zu Unrecht hohe Platzierungen einbüßen mussten.


Es handelt sich bei dem Update um eine Serie von Algorithmen, die es ermöglichen, Webseiten mit einer sehr guten Nutzererfahrung (User Experience) in der Ergebnisliste weiter oben zu platzieren (vgl. Cutts 2012b). Die Identifikation und die Beurteilung solcher Webseiten beruht auf den Techniken des maschinellen Lernens und erfolgt in algorithmischer Logik. Entwickelt wurde dieser Algorithmus von dem Google-Ingenieur Naveet Panda, auf den der Name des Updates zurückgeht (vgl. Larkins 2012). Das primäre Ziel dieser Qualitätsoffensive von Google ist es, Webseiten mit einer minderwertigen Qualität und wenig Mehrwert für den Benutzer innerhalb der Ergebnisliste weiter unten zu platzieren, beziehungsweise ganz zu eliminieren. Auf diese Weise soll die User Experience von Google als Dienstleister selbst erhöht werden. Mit dieser Neuerung gelang es Google nicht nur Webseiten qualitativ einstufen zu können, sondern auch algorithmische Logik und Nutzerverhalten zu verbinden (vgl. Tober; Mey 2011 und Firnkes 2012, S. 340). 


Im Visier des Panda-Updates stehen die so genannten ``Content Farmen'', die mit Hilfe von Spamtechniken die Qualität der Google-Suchergebnisse bereits seit längerem mindern (vgl. Johnson 2012, S. 38). Die Betreiber von Content Farmen lösten im engeren Sinne eine simple mathematische Rechnung: Populäre Suchmaschinen veröffentlichen regelmäßig die Top-Suchbegriffe ihrer Benutzer, weshalb Spambetreiber meist mit einem geringen Aufwand simple Artikel mit diesen Top-Suchbegriffen auf ihren Webseiten publizieren, oder sogar lediglich darauf verweisen. Auf diese Weise gelingt es ihnen hohe Platzierungen innerhalb der Ergebnisliste und damit hohe Besucherströme zu erzeugen. Die Erlösgenerierung erfolgt anschließend aus der Onlinewerbung (vgl. Firnkes 2012, S. 340). Das Google Panda-Update -- im SEO-Jargon auch häufig als Farmer-Update bezeichnet -- degradiert somit Webseiten mit wenig eigenen und duplizierten Inhalten (vgl. Rickman 2012, S. 41). Matt Cutts, Leiter des Google Webspam Teams, begründet die Einführung des Panda-Updates unter Anderem damit, dass Google-Benutzer sofort auf relevante Inhalte weitergeleitet werden möchten, anstatt sich erst durch Linksammlungen durchzuklicken (vgl. Cutts; Singhal 2011).


Im April 2011 wurde das Panda-Update für alle englischsprachigen Anfragen weltweit wirksam. Seit August 2011 beeinflusst das Panda-Update 2.4 auch deutschsprachige Suchanfragen (vgl. Schwartz 2012). Webseiten mit redaktionellen und für den Internetbenutzer mehrwertigen Artikeln, wie beispielsweise www.welt.de profitieren von dem Update. Webseiten mit nur wenig eigenen Inhalten und Artikeln, die die Inhalte anderer Webseiten zusammenfassen, beziehungsweise nur darauf verweisen, müssen Platzierungen einbüßen. Johannes Beus, Gründer und Geschäftsführer von SISTRIX, veröffentlichte kurz nach der Einführung des Panda Updates in Deutschland eine Liste mit 35 betroffenen Webseiten (vgl. Beus 2011). Preisvergleichsportale wie www.kelkoo.de und www.wikio.de mussten bis zu 86\% der Sichtbarkeit innerhalb von Google einbüßen (siehe Abbildung ~\ref{fig: sistrix_btroffene}). Webseiten, wie beispielsweise www.alatest.de, die benutzergenerierte Inhalte aus dem Internet gebündelt anbieten, verloren bis zu 70\% der Sichtbarkeit. Gemeinsam haben die Top-Drei der betroffenen Webseiten, dass sie mit wenig eigenen Inhalten auf Inhalte anderer Webseiten verweisen. Seit 2011 wirde das Panda-Update weiterhin aktualisiert und optimiert. Zuletzt fand eine Aktualisierung im Juli dieses Jahres statt, sodass Experten heute von Panda-Update 3.9 sprechen.

\begin{figure}[H]
\begin{center}
\fbox{\includegraphics[width=16cm]{img/sistrix_betroffene.JPG}}
\caption{Ein Auszug der vom Panda Update betroffenen Webseiten in Deutschland (Quelle: Beus 2011)}
\label{fig: sistrix_btroffene}
\end{center}
\end{figure}

Aus den bisher beschriebenen Sachverhalten geht hervor, dass eines der primären Ziele von Google, als profitgenerierendes Unternehmen, die bestmögliche Zufriedenheit seiner Benutzer ist. Seit der Einführung des Panda-Updates spielt die Benutzerfreundlichkeit von Webseiten innerhalb der Platzierung von Suchergebnisse mehr denn je eine wichtige Rolle. SEO-Experten weltweit sprechen deshalb von einer Pre- bzw. einer Post-Panda Phase und unterteilen SEO-Techniken dementsprechend (vgl. Schwartz 2012). Diese Entwicklung spiegelt sich ebenfalls  in den zahlreichen Aktualisierungen des Google-Algorithmus nach dem Panda Update wieder. Neben den unzähligen weniger bedeutungsvollen Veränderungen, werden an dieser Stelle zwei weitere Updates genannt, die innerhalb der Post-Panda Phase eine maßgebliche Rolle spielen. Zu Beginn dieses Jahres präsentierte Google den neuen ``Page Layout Algorithmus'', der Webseiten mit wenig Inhalten beziehungsweise viel Werbung in dem oberen Bereich der Webseite („above the fold“) in den Suchergebnissen weiter unten platziert (vgl. Cutts 2012a). Im April 2012 wurde ein weiterer Algorithmus unter dem Codenamen ``Penguin'', den Matt Cutts als einen weiteren Schritt in Richtung qualitativ hochwertiger Webseiten in den Suchergebnissen bezeichnet, eingeführt (vgl. Cutts 2012b). Das Panda-Update, das die inhaltliche Qualität einer Webseite fokussiert, wird mit der Einführung von Penguin um eine Webspam-Komponente, wie unter Anderem der Abstrafung von Keyword Stuffing, ergänzt. Gemeinsam verhelfen diese drei Updates qualitativ hochwertige Webseiten innerhalb der Ergebnisliste weiter oben zu platzieren, um dadurch die Qualität von Google zu verbessern.

\subsection{Einbruch des Sichtbarkeitsindexes am 15. August 2011}

Trotz der zahlreichen Google-Aktualisierungen in den letzten zwei Jahren, gab es in dem Sichtbarkeitsindex von SISTRIX für den Deutschen Bildungsserver keinen so bedeutungsvollen Einbruch, wie am 15. August 2011 (vgl. Abbildung ~\ref{fig: panda_sichtbarkeit}).

\begin{figure}[H]
\begin{center}
\fbox{\includegraphics[width=16cm]{img/panda_sichtbarkeit.JPG}}
\caption{Sichtbarkeitsindex des Deutschen Bildungsservers (Quelle: SISTRIX)}
\label{fig: panda_sichtbarkeit}
\end{center}
\end{figure}



Der Sichtbarkeitsindex von SISTRIX hat sich zu einem der populärsten Werkzeug der Suchmaschinenoptimierung in Deutschland etabliert und misst die Sichtbarkeit einer Domain innerhalb der Suchergebnisse von Google. Die Grundidee hinter dieser Kennzahl ist die regelmäßige Beobachtung einer großen Keywordbasis mit den jeweils ersten 100 Ergebnissen (vgl. Beus 2009). Für etwa 25 Millionen Datenpunkte wird je nach erwarteter Klickrate und Suchvolumen ein gewichteter Wert gebildet, der aufsummiert den Sichtbarkeitsindex darstellt (vgl. Beus 2009). 


Auch wenn die Liste mit den vom Panda-Update betroffenen Webseiten von Beus (vgl. Kapitel 7.1) den Deutschen Bildungsserver nicht enthält, so liegt trotzdem die Vermutung nahe, dass der Deutsche Bildungsserver ebenfalls betroffen ist. Die 35 veröffentlichten Webseiten haben ebenso wie der Deutsche Bildungsserver einen gravierenden Einbruch im Sichtbarkeitsindex am 15. August 2011. Darüber hinaus gehören zum Konzept der betroffenen Webseiten entweder benutzergenerierte Artikel (z.B. www.online-artikel.de) oder Inhalte anderer Webseiten (z.B. Preisvergleichsportale, wie www.kelkoo.de). An dieser Stelle lässt sich eine Parallele zum Konzept des Deutschen Bildungsservers ziehen, der zu Unrecht aufgrund des Panda-Updates hohe Rankings einbüßen musste. Daran zeigt es sich deutlich, dass das Panda-Update zwar eine gute Methode zur Einschätzung von Webseiten darstellt, die Unterscheidung zwischen Webspam und Nicht-Webspam muss weiterhin stark fokussiert und optimiert werden.


Zusammenfassend sind es also die fehlenden eigenen Beiträge und fremde Inhalte, die die Benutzer dazu verleiten entweder zurück zu den Suchergebnissen zu kehren, oder durch Weiterklicken auf andere Webseiten zu wechseln. Google vermag solches Verhalten der Benutzern anhand maßgebender Zahlen zu analysieren. Welche Kennzahlen dazu beitragen, zeigt das folgende Kapitel.

\subsection{Der gegenwärtige Forschungsstand und wichtige Kennzahlen}

Das Google Panda Update feierte vor wenigen Wochen seinen ersten Geburtstag in Deutschland. Es ist demnach ein sehr junges Thema, an das sich bis jetzt nur wenige deutsche Autoren gewagt haben. So beleuchtet beispielsweise Dirk Schiff das ,,Geheimnis SEO'' in seinem Buch und nennt einige Fehler, die man vermeiden sollte, um den Panda-Standards zu entsprechen (vgl. Schiff 2012, S. 184 ff). Firnkes zeigt die Auswirkungen des Panda-Updates im Hinblick auf Blogs und erklärt die Bedeutung von Content Farmen (vgl. Firnkes 2012, S. 339 ff). Zum Ende dieses Jahres soll ein Buch von Sebastian Erlhofer erscheinen, das die Themen Google Panda und Penguin im Hinblick auf die Onpage-Optimierungen fokussiert und Optimierungsvorschläge für die Webseitenstruktur gibt.\footnote{Erlhofer, Sebastian (2012): Suchmaschinen-Optimierung. Das umfassende Handbuch: Aktuell zu Google Panda und Penguin. 6., erw. Ausg. Bonn: Galileo Press (Galileo Computing).} Auf dem amerikanischen Markt ist der Forschungsstand voran geschrittener: eine Vielzahl von Publikationen behandelt ausführlich die Einführung und die Auswirkungen des Panda Updates aus verschiedenen Perspektiven (vgl. Jones 2012; Johnson 2012; Rickman 2012). Darüber hinaus gibt eine ehemalige Google Mitarbeiterin Tipps, wie man die Sichtbarkeit innerhalb der Google-Trefferliste im Kontext des Panda Updates erhöhen kann (vgl. Fox 2012). Eine weit aus größere Anzahl an Ratschlägen im Umgang mit den Panda Anforderungen, lässt sich innerhalb von Internetdiskussionsforen finden. Professionelle Suchmaschinenoptimierer aus aller Welt diskutieren Hintergründe, Auswirkungen und Gegenmaßnahmen des Panda Updates (vgl. Tober; Mey 2011; Preuten 2012; Nemitz 2012). 


Wie bereits weiter oben angedeutet, ist Google mittlerweile fähig, das Nutzungsverhalten seiner Benutzer zu analysieren und in algorithmische Logik umzuwandeln. Doch anhand welcher Kriterien unterscheidet der Google-Algorithmus qualitativ hochwertige Webseiten von den minderwertigen Webseiten? Gewiss ist die Geheimhaltung dieser Information eines der primären Ziele von Google als Unternehmen. Dennoch haben sich seit der Einführung des Panda-Updates in der Literatur und in den zahlreichen Diskussionsforen bestimmte Kennzahlen als besonders signifikant etabliert. Eine der wichtigsten Kennzahlen, die seit dem Panda-Update mehr denn je eine große Rolle spielt, ist die Zeit, die die Benutzer auf einer Webseite verbringen (vgl. Rickman 2012, S. 42). Aus der Verweildauer und der Absprungrate der Benutzer leitet Google die Qualität der Inhalte dieser Webseite ab. Schafft es eine Webseite den Benutzer in die Tiefe ihrer Inhalte zu ziehen, ohne dass diese nach bereits wenigen Sekunden verlassen wird, dann stellen die Inhalte dieser Webseite für Google einen interessanten Mehrwert für die Benutzer dar.


Die durchschnittliche Verweildauer auf dem Deutschen Bildungsservers beträgt für den Zeitraum zwischen dem 18.08.2012 und dem 17.09.2012 1 Minute und 40 Sekunden und die Absprungrate liegt bei über 56\% (vgl. Abbildung ~\ref{fig: besuchsdauer_absprungrate}). Das heißt die Webseite des Deutschen Bildungsservers verliert über die Hälfte der Besucher nach bereits fast anderthalb  Minuten. Natürlich stellt der Deutsche Bildungsserver durchaus einen Mehrwert für die Benutzer dar, indem es ihnen weiterführende Links vorschlägt und so ihren Informationswünschen nachkommt. So findet beispielsweise ein Benutzer bereits nach weniger als drei Klicks den Link zu der

\begin{figure}[H]
\begin{center}
\fbox{\includegraphics[width=16cm]{img/besuchsdauer_absprungrate.JPG}}
\caption{Durchschnittliche Besuchsdauer, Absprungrate, sowie weitere Statistiken für den Deutschen Bildungsserver in dem Zeitraum 18.08.2012 bis 17.09.2012. (Quelle: Google Analytics)}
\label{fig: besuchsdauer_absprungrate}
\end{center}
\end{figure} 

gesuchten Information und wechselt zu der vorgeschlagenen Webseite. Ein anderer Benutzer hat vielleicht nach weniger als drei Klicks keine Lust mehr zu suchen und verlässt den Deutschen Bildungsserver. So oder so deutet Google daraus, dass die präsentierten Inhalte für eine Vielzahl der Benutzer als nicht relevant erscheinen, weshalb die Webseite nach kurzer Zeit wieder verlassen wird. Zwar vermag der Google Algorithmus zwischen einem langen und einem kurzen Besuch einer Webseite zu unterscheiden, wieso letztendlich die Webseite verlassen wurde, bleibt heute noch außerhalb der Reichweite eines Algorithmus. Neben anderen Aspekten, bewirkt die fehlende Interpretationskraft des Google Algorithmus, dass der Deutsche Bildungsserver hohe Platzierungen einbüßen muss und hinter Webseiten mit einer höheren Besuchszeit und einer kleineren Absprungrate innerhalb der Trefferliste erscheint. Unumstritten ist dies keine Patentlösung, die Google zur Bekämpfung von Webspam anwendet. In diesem Zusammenhang ist ein weiterer Datenwert von großer Bedeutung, nämlich die Bereitschaft der Benutzer Inhalte einer Webseite auf sozialen Netzwerken zu teilen. Erhalten zahlreiche Artikel viele „Likes“ bzw. „+1“ belohnt dies Google mit höheren Platzierungen (vgl. Rickman 2012, S. 42). Eine ständige Beobachtung der sozialen Aktivitäten würde die Interessen der Benutzer aufzeigen und potentielle Optimierungsbereiche des Deutschen Bildungsservers beleuchten. Google Analytics bietet eine umfangreiche Komponente zur Analyse von sozialen Aktivitäten, die mit Administratorrechten in wenigen Schritten freigeschaltet werden kann.

Eine weitere maßgebende Metrik, die bereits vor dem Panda Update signifikant für die Relevanzbeurteilung war, ist die Klickrate (Click through rate) innerhalb der Ergebnisliste. Diese Zahl misst den Anteil der erfolgten Klicks an den Impressionen (vgl. Firnkes 2012, S. 340). Je mehr Benutzer also auf eine Webseite klicken, desto besser und relevanter muss diese sein (vgl. Beck 2011, S. 40). Das Unternehmen Slingshot SEO stellt eine interessante Studie zur Klickrate innerhalb von Suchergebnislisten vor, der nach die Klickrate für das erste Ergebnis bei knapp 18\%, für das fünfte Ergebnis bereits bei knapp 3\% und für das zehnte Ergebnis bei lediglich 1\% liegt (vgl. Slingshot SEO 2011). Eine zufriedenstellende Klickrate ist daher vor allem von der Position innerhalb der Trefferliste abhängig. Die Klickrate für den Deutschen Bildungsserver ist in Abbildung ~\ref{fig: ctr} zu sehen. Die durchschnittliche Position innerhalb der Google Trefferliste liegt auf dem 17. Platz und zeugt von einem Verbesserungspotential. Im Vergleich dazu ist die durchschnittliche Klickrate (CTR) erfreulicher und liegt bei über 6\%. 

\begin{figure}[H]
\begin{center}
\fbox{\includegraphics[width=16cm]{img/ctr.JPG}}
\caption{Anzahl der Impressionen und der Klicks, sowie die durchschnittliche Position und die Klickrate für den Deutschen Bildungsserver in dem Zeitraum 18.08.2012 bis 17.09.2012. (Quelle: Google Analytics)}
\label{fig: ctr}
\end{center}
\end{figure} 


Zusammenfassend führt eine benutzerfreundliche Webseite mit interessanten und für den Benutzer wertvollen Inhalten zu einer größere Wertschätzung seitens der Benutzer und damit zur erhöhten Verweildauer auf der Webseite, sowie zur häufigeren sozialen Aktionen. Google belohnt eine Verbesserung der vorgestellten Kennzahlen mit einer besseren Sichtbarkeit der Webseite und damit mit höheren Rankings innerhalb der Trefferliste. 

\subsection{Empfohlene Optimierungsvorschläge}
Die Problematik des Panda Updates wurde bis jetzt kaum empirisch behandelt (vgl. Kapitel 7.3). Die Entscheidung, welche Gegenmaßnahmen anzuwenden sind, fällt deshalb schwierig. Nichtsdestotrotz ist Google bemüht wenigstens kleine Einblicke in die Funktionalität seines Suchalgorithmus zu geben, um Webseitenbetreibern, die zu Unrecht aufgrund von Updates an Sichtbarkeit verloren haben, zu helfen. Eine vertrauliche Quelle in diesem Zusammenhang stellt der Google Webmaster Central Blog{\footnote{\url{http://www.googlewebmastercentral.blogspot.de/}}} dar, in dem Google Ingenieure regelmäßig Neuigkeiten zum Crawling- und Indizierungsprozess veröffentlichen. 


Wenige Monate nach der Einführung des Panda-Updates war Google bemüht ein Stück Transparenz in die Bewertung von qualitativ hochwertigen Webseiten zu bringen, um den zahlreichen Diskussionen auf der ganzen Welt entgegen zu wirken. Tabelle ~\ref{tab: checkliste} zeigt eine Checkliste, die von Google Ingenieuren angewandt wurde, um den Panda-Algorithmus zu generieren. Sicherlich enthält die Liste einige Aspekte, die in Bezug auf den Deutschen Bildungsserver irrelevant sind, wie beispielsweise die Frage bezüglich der Werbung auf einer Webseite. Dennoch sind auch Kriterien dabei, wie bspw. die Frage nach doppelten und sich überschneidenden Inhalten, die das Verbesserungspotential der Webseite des Deutschen Bildungsservers ansprechen.  



Anhand der vorgestellten Literatur, den Empfehlungen von Experten (vgl. Kapitel 7.3) und der Checkliste aus dem Google Webmaster Central Blog (vgl. Tabelle ~\ref{tab: checkliste}) wird deutlich, dass der Benutzer, als ein entscheidender Einflussfaktor zunehmend fokussiert wird und die Disziplin der Benutzerfreundlichkeit einer Webseite im Kontext der Suchmaschinenoptimierung stärker denn je an Signifikanz gewinnt. In Bezug auf die Webseite des Deutschen Bildungsservers kristallisieren sich daraus bestimmte Bereiche, die in Zukunft optimiert werden sollten, um die in Kapitel 7.3 vorgestellten Kennzahlen zu verbessern. Die Optimierungsvorschläge werden im Folgenden anhand der Webseite www.experto.de veranschaulicht. Darüber hinaus werden Optimierungen im Hinblick auf die Verweildauer auf der Webseite, die Benutzerfreundlichkeit und die Sitemap angesprochen.
\begin{table}[H]
\begin{center}
\fbox{
\begin{minipage}{17cm}
\begin{tabular}{p{16cm}}

\small Would you trust the information presented in this article?\\
\small Is this article written by an expert or enthusiast who knows the topic well, or is it more shallow in nature?\\ 
\small Does the site have duplicate, overlapping, or redundant articles on the same or similar topics with slightly different keyword variations?\\
\small Would you be comfortable giving your credit card information to this site?\\
\small Does this article have spelling, stylistic, or factual errors?\\
\small Are the topics driven by genuine interests of readers of the site, or does the site generate content by attempting to guess what might rank well in search engines?\\
\small Does the article provide original content or information, original reporting, original research, or original analysis?\\
\small Does the page provide substantial value when compared to other pages in search results?\\
\small How much quality control is done on content?\\
\small Does the article describe both sides of a story?\\
\small Is the site a recognized authority on its topic?\\
\small Is the content mass-produced by or outsourced to a large number of creators, or spread across a large network of sites, so that individual pages or sites don’t get as much attention or care?\\
\small Was the article edited well, or does it appear sloppy or hastily produced?\\
\small For a health related query, would you trust information from this site?\\
\small Would you recognize this site as an authoritative source when mentioned by name?\\
\small Does this article provide a complete or comprehensive description of the topic?\\
\small Does this article contain insightful analysis or interesting information that is beyond obvious?\\
\small Is this the sort of page you’d want to bookmark, share with a friend, or recommend?\\
\small Does this article have an excessive amount of ads that distract from or interfere with the main content?\\
\small Would you expect to see this article in a printed magazine, encyclopedia or book?\\
\small Are the articles short, unsubstantial, or otherwise lacking in helpful specifics?\\
\small Are the pages produced with great care and attention to detail vs. less attention to detail?\\
\small Would users complain when they see pages from this site?\\
\end{tabular}

\end{minipage}
}
\caption{Kriterien, die von Google zur Unterscheidung zwischen qualitativ hochwertigen und qualitativ minderwertigen Webseiten herangezogen werden.(Quelle: Singhal 2011)}
\label{tab: checkliste}
\end{center}
\end{table}





\subsubsection{www.experto.de als Beispiel für erfolgreiche Gegenmaßnahmen} 

experto.de ist ein deutsches Online-Expertenportal, das Beratungsartikel zu zahlreichen Themen zur Verfügung stellt (vgl. Experto 2012). Laut der Liste mit den betroffenen Webseiten von Johannes Beus verlor experto.de mit der Einführung des Panda Updates über 50\% der Sichtbarkeit innerhalb der Google-Ergebnisliste (vgl. Abbildung ~\ref{fig: sistrix_btroffene}). Nur wenige Monate später wurde ein Aufschwung des Sichtbarkeitsindexes beobachtet (vgl. Abbildung ~\ref{fig: experto_sistrix}). Wenn in diesem Zeitraum Veränderungen an der Webseite durchgeführt wurden, dann sind diese eine beispielhafte Vorgehensweise, um nach dem ,,Panda-Tief'' wieder aufzusteigen. 

\begin{figure}[H]
\begin{center}
\fbox{\includegraphics[width=16cm]{img/experto_sistrix.JPG}}
\caption{Der Sichtbarkeitsindex für www.experto.de. (Quelle: SISTRIX)}
\label{fig: experto_sistrix}
\end{center}
\end{figure} 


Das Internetportal ``Wayback Machine'' enthält über 150 Milliarden Webseiten, die seit 1996 bis heute archiviert wurden (vgl. Wayback Machine 2012). 
Mit seiner Hilfe ist es möglich die Entwicklung bestimmter Webseiten innerhalb der letzten Wochen, Monaten oder sogar Jahren zu beobachten. Es stellt also archivierte Abbildungen von einer Vielzahl von Webseiten zur Verfügung. Auch wenn dabei die technischen Veränderungen außen vor gelassen werden müssen und das zu betrachtende Datum nur bedingt wählbar ist -- da von dem Zeitpunkt des Crawlens abhängig --, stellt die Wayback Machine dennoch eine geeignete Methode dar, um die optischen Veränderungen der Webseite www.experto.de innerhalb der letzten dreizehn Monate zu beobachten. Eine weitere Einschränkung, die einer umfassenden Unterschiedsprüfung entgegen wirkt, ist die fehlende Möglichkeit eine archivierte Webseite in ihrer Tiefe zu betrachten. Denn es handelt sich bei den Darstellungen um Abbildungen der Startseiten, die zwar in ihrer gesamten Größe betrachtet werden können, das Browsen durch die einzelnen Unterseiten jedoch nicht ermöglichen. Abbildung ~\ref{fig: expertoaltoben} zeigt den oberen und Abbildung ~\ref{fig: expertoaltunten} den unteren Bereich der Startseite www.experto.de am 19. Juli 2011.


Abbildungen ~\ref{fig: expertoneuoben} und ~\ref{fig: expertoneumitte} zeigen die gegenwärtige Startseite von www.experto.de. Anhand der Veränderungen der Startseite lassen sich bestimmte Optimierungsaspekte auf die Webseite des Deutschen Bildungsservers übertragen.


\begin{figure}[H]
\begin{center}
\fbox{\includegraphics[width=16cm]{img/expertoaltoben.JPG}}
\caption{Der obere Bereich der Startseite www.experto.de am 19.07.2011. (Quelle: Wayback Machine 2012a)}
\label{fig: expertoaltoben}
\end{center}
\end{figure} 

\vspace{3cm}

\begin{figure}[H]
\begin{center}
\fbox{\includegraphics[width=16cm]{img/expertoaltunten.JPG}}
\caption{Der untere Bereich der Startseite www.experto.de am 19.07.2011. (Quelle: Wayback Machine 2012a)}
\label{fig: expertoaltunten}
\end{center}
\end{figure} 


\begin{figure}[H]
\begin{center}
\fbox{\includegraphics[width=16cm]{img/expertoneuoben.JPG}}
\caption{Der obere Bereich der Startseite www.experto.de am 19.09.2012. (Quelle: www.experto.de)}
\label{fig: expertoneuoben}
\end{center}
\end{figure} 

\begin{figure}[H]
\begin{center}
\fbox{\includegraphics[width=16cm]{img/expertoneumitte.JPG}}
\caption{Der mittlere Bereich der Startseite www.experto.de am 19.09.2012. (Quelle: www.experto.de)}
\label{fig: expertoneumitte}
\end{center}
\end{figure} 

\subsubsection{Verweildauer auf der Webseite erhöhen}
Vergleicht man die neue und die alte Startseite von experto.de so fallen zahlreiche optische Veränderungen auf. Insgesamt ist die Startseite schmaler geworden und fokussiert den linken Darstellungsbereich. Anhand der vertikalen Scroll-Leiste erkennt man, dass die Startseite länger geworden ist. Im Vergleich zu der Vorgängerversion enthält die neue Startseite mindestens doppelt so viel erklärenden Text. Der obere Bereich präsentiert im Sekundentakt unterschiedliche Beiträge von Experten. Unterhalb der Navigationsleiste wird ein längerer Vorspann eines Spezial-Beitrags präsentiert. Im weiteren Verlauf der Startseite werden weiterführende Links angeboten. Die einzelnen Links werden nicht nur bloß dargestellt, sondern auch in wenigen Zeilen beschrieben, ohne den Besucher zu überfordern. Auf der gesamten Startseite werden Teaser eingesetzt und leiten den Besucher durch bestimmte Inhalte der Webseite. Die so genannten Teaser bestehen meist aus einem Titel, einem Vorspann, einem illustrierenden Bild und mindestens einem weiterführenden Link und sollen primär die Neugier des Lesers wecken (vgl. Seibold 2002, S. 66). Der rechte Abschnitt der Startseite zeigt einen Vorspann  des Artikel des Monats, die beliebtesten Autoren, sowie die Newsletter-Registrierung und eine Umfrage. Insgesamt ist die neue Startseite im Vergleich um ein Mehrfaches reicher an Inhalten geworden.

 
Die beschrieben Veränderungen führen dazu, dass die Besucher sich insgesamt länger mit den präsentierten Inhalten beschäftigen und so länger auf der Webseite verweilen. Die Teaser wecken die Neugier und bewirken aufgrund ihrer Länge ein Scrollen der Webseite. Die Slideshow im oberen Bereich verleitet den Benutzer, sich die gesamte Präsentation anzuschauen und verlängert dadurch seine Besuchszeit. Ebenso verlockend wirkt sich die Umfrage zu Schlafstörungen im rechten Bereich der Startseite aus, an der der Besucher direkt teilnehmen kann. 


Im Hinblick auf die Startseite des Deutschen Bildungsservers empfiehlt sich insbesondere eine Modifikation des Neuigkeiten-Bereichs. Die jetzige Darstellung ähnelt vielmehr einer Liste, als einer interaktiven Webseite (vgl. Abbildung ~\ref{fig: dbs_neuigkeiten}). Die Einbindung von Teasern würde die Darstellung benutzerfreundlicher und übersichtlicher gestalten. Darüber hinaus würde die Startseite in die Länge wachsen und die Neugier des Besuchers wecken. Die Aufforderung an die Besucher, sich an Wikis, Blogs etc. zu beteiligen, könnte in den oberen rechten Bereich der Darstellung wechseln und so für größere Aufmerksamkeit sorgen. 


Wie am Beispiel von experto.de gesehen, könnte der mittlere Bereich der Webseite vergrößert werden und so mehr Platz für weitere nützliche Inhalte bieten. Insgesamt werden auf diese Weise zahlreiche, für den Benutzer einen Mehrwert darstellende Inhalte eingebunden, die die Besuchszeit verlängern und den Besucher tiefer in die Webseite ziehen.

\begin{figure}[H]
\begin{center}
\fbox{\includegraphics[width=16cm]{img/dbs_neuigkeiten.JPG}}
\caption{Die Startseite des Deutschen Bildungsservers. (Quelle: www.bildungsserver.de)}
\label{fig: dbs_neuigkeiten}
\end{center}
\end{figure} 



\subsubsection{Benutzerfreundlichkeit der Inhalte verbessern}
Wie bereits in den vorangegangenen Kapiteln beschrieben, spielt die Benutzerfreundlichkeit einer Webseite im Panda-Kontext eine signifikante Rolle. Dies gilt insbesondere für die textuellen Inhalte auf einer Webseite (vgl. Singhal 2011). Im Folgenden werden deshalb Optimierungsvorschläge präsentiert, die auf leserfreundlichere Inhalte abzielen und in zukünftigen Projekten realisiert werden können.


Der Text auf einer Webseite stellt den zentralen Kommunikationsinstrumenten für die Betreiber mit den Besuchern der Webseite dar. Eine akkurate und übersichtliche Textformatierung ist dabei besonders wichtig. Schließlich liegt es im Interesse der Betreiber, dass die häufig teuer erstellten Inhalte von den Benutzern auch wahr genommen und gelesen werden. Abbildung ~\ref{fig: grundschule_orig} zeigt einen Textauszug aus der Webseite des Deutschen Bildungsservers (vgl. Deutscher Bildungsserver 2012c)  

\begin{figure}[H]
\begin{center}
\fbox{\includegraphics[width=16cm]{img/grundschule_orig.JPG}}
\caption{Beschreibung des deutschen Primarbereichs. (Quelle: Deutscher Bildungsserver 2012c)}
\label{fig: grundschule_orig}
\end{center}
\end{figure} 


Der Schreibstil und die Rechtschreibung sind einwandfrei. Die Darstellung des Textes lässt allerdings Optimierungsvorschläge zu. Abbildung ~\ref{fig: grundschule_mod} zeigt eine modifizierte Variante des Textblocks. Die Inhalte des Textes blieben unberührt, wo hingegen die Struktur des Textes übersichtlicher gestaltet wurde. Hinzugefügt wurden eine aussagekräftigere Überschrift, die sowohl von der Farbe, als auch von der Größe hervorgehoben ist, ein zusammenfassender Satz unter der Überschrift (ähnlich einem Zeitungsartikel) und mehrere Unterüberschriften. Darüber hinaus wurde der Zeilenabstand zwischen den einzelnen Textblöcken vergrößert. Auf diese Weise fällt es den Benutzern leichter sich innerhalb des Textes zu orientieren. Die Besucher können anhand der Unterüberschriften entscheiden, welche Textblöcke ihr Informationsbedürfnis stillen werden. Die interne Verlinkung zwischen den einzelnen Artikeln (vgl. Abbildung ~\ref{fig: grundschule_mod}) signalisiert Google außerdem, dass es sich bei der Webseite um keine Content Farm handelt (vgl. Johnson 2012).


Neben der Textformatierung führt eine bessere Typographie zu benutzerfreundlicheren Leseerlebnissen. Eine breitere Content-Spalte führt zu einer übersichtlicheren Textdarstellung und ermöglicht es mehr Inhalte im oberen Bereich der Webseite zu platzieren. Ein kontrastreicher Font, so wie er bei experto.de beobachtet wurde (vgl. Abbildung ~\ref{fig: expertoneuoben} und ~\ref{fig: expertoneumitte}) gewährt eine bessere 

\begin{figure}[H]
\begin{center}
\fbox{\includegraphics[width=16cm]{img/grundschule_mod.jpg}}
\caption{Eine optimierte Beschreibung des deutschen Primarbereichs. (Eigene Darstellung in Anlehnung an Deutscher Bildungsserver 2012c)}
\label{fig: grundschule_mod}
\end{center}
\end{figure} 

Lesbarkeit des Textes und steigert die Benutzerfreundlichkeit der Webseite. Der weiterführende Link auf eine andere Webseite sollte idealerweise am Ende des eigenen Textes platziert werden, um den Benutzer so lange wie möglich mit den eigene Inhalten zu beschäftigen. 


\subsubsection{HTML-Sitemap akkurat gestalten}
Um ein hochwertiges Anwendererlebnis zu gewährleisten, reicht es selbstverständlich nicht aus, die Webseite einladender und die Texte lesefreundlicher zu gestalten. Neben einer Vielzahl weitere Aspekte ist der Navigation auf einer Webseite eine große Bedeutung zuzuschreiben (vgl. Nielsen; Tahir 2004). Eine zentrale Rolle spielt dabei die Sitemap der Webseite. Dabei unterscheidet man zwischen einer XML-Sitemap, die primär für Suchmaschinen konzipiert wird und einer HTML-Sitemap, die zur Navigation der Benutzer dient. Beide Versionen sollten von den Betreibern einer Webseite entwickelt werden. Die erstere wird in Kapitel 10.3.5 behandelt. Die letztere sollte insbesondere auf einer so umfangreichen Domain, wie der des Deutschen Bildungsservers eine akkurate Übersicht über die einzelnen Bereiche geben.

\begin{figure}[H]
\begin{center}
\fbox{\includegraphics[width=16cm]{img/dbs_sitemap.JPG}}
\caption{Ein Auszug aus der HTML-Sitemap des Deutschen Bildungsservers. (Quelle: Deutscher Bildungsserver 2012d)}
\label{fig: dbs_sitemap}
\end{center}
\end{figure} 



Leider bietet die jetzige HTML-Sitemap des Deutschen Bildungsservers nur wenig Übersicht (vgl. Abbildung ~\ref{fig: dbs_sitemap}). Obwohl die HTML-Sitemap primär dem Benutzer zu einer einfacheren Navigation dienen sollte, ähnelt die jetzige Sitemap des Deutschen Bildungsservers vielmehr einer Liste aus unzähligen Links. Abbildung ~\ref{fig: expertositemap} zeigt die HTML-Sitemap von www.experto.de, die an dieser Stelle als ein Beispiel für eine benutzerfreundliche Sitemap fungiert. Die einzelnen Haupt- und Unterthemen der Webseite sind als solche deutlich zu erkennen und können angeklickt werden. Die eingesetzten Farben harmonieren mit der Schrift und verhelfen einzelne Bereiche der Webseite zu unterscheiden. 


Zwar wird die HTML-Sitemap in den vorgestellten Referenzen (vgl. Kapitel 7.3) im Zusammenhang mit dem Panda Update nicht erwähnt, allerdings ist eine akkurate Übersicht über die Informationsarchitektur ein wichtiger Aspekt benutzerfreundlicher Webseiten (vgl. Nielsen, Tahir 2004). 



\begin{figure}[H]
\begin{center}
\fbox{\includegraphics[width=16cm]{img/expertositemap.JPG}}
\caption{Ein Auszug aus der HTML-Sitemap der experto.de Webseite. (Quelle: Experto 2012a)}
\label{fig: expertositemap}
\end{center}
\end{figure} 


\subsection{Fazit}
Die Intention hinter dem Panda Update ist die Eliminierung von für den Benutzer qualitativ minderwertigen Suchergebnissen aus der Google-Ergebnisliste. Die genaue Formel zur Berechnung des Rankings von qualitativen Webseiten bleibt aus Schutz vor Manipulationen geheim. Dennoch kristallisiert sich der Aspekt eines erfolgreichen Benutzererlebnisses als signifikant heraus. Ist meine Webseite benutzerfreundlich? Wie schnell lädt meine Webseite? Finden meine Besucher die Information die sie suchen und werden meine Artikel gelesen? Das sind die Fragen, die sich die vom Panda betroffenen Webseitenbetreiber vor Augen führen sollen, um der Sanktion zu entkommen. Abbildung ~\ref{fig: panda_fazit} fasst im oberen Bereich die Aspekte der Benutzerfreundlichkeit zusammen, die insbesondere seit dem Panda Update entscheidend sind. Im linken Bereich werden die Anforderungen an die inhaltliche Qualität der Texte auf der Webseite aufgezeigt. Zusätzlich werden Kennzahlen aufgezählt, die im Panda Kontext besonders wichtig sind. Die präsentierten Aspekte sind aus Platzgründen unvollständig und sollen vielmehr den Weg aus dem Panda-Tief aufzeigen, als dass sie eine vollzählige Anleitung bieten. 

\begin{figure}[H]
\begin{center}
\fbox{\includegraphics[width=16cm]{img/panda_fazit.JPG}}
\caption{Komprimierte Zusammenfassung der wichtigsten Aspekte im Hinblick auf das Panda Update. (Eigene Darstellung in Anlehnung an Johnson 2012; Schiff 2012; Singhal 2012)}
\label{fig: panda_fazit}
\end{center}
\end{figure} 

Ein Suchmaschinenoptimierer musste sich vor dem Panda Update nahezu keine Gedanken um die Benutzerfreundlichkeit der zu optimierenden Webseite machen. In der Post-Panda Phase ist das anders: wird eine Webseite von den Benutzern geschätzt, so belohnt Google dies mit guten Platzierungen innerhalb der Ergebnisliste. Wenn der Besucher sich länger mit den Inhalten der Webseite beschäftigt, die Tiefe der Webseite erkundet oder sogar ein Artikel innerhalb von sozialen Netzwerken weiter empfiehlt, so signalisiert dieses Benutzerverhalten Google, dass es sich höchstwahrscheinlich um eine benutzerfreundliche und qualitativ hochwertige Webseite handelt. Zusammenfassend sei an dieser Stelle auf die Worte von Matt Cutts hingewiesen:  \textit{,,The goal of many of our ranking changes is to help searchers find sites that provide a great user experience and fulfill their information needs. We also want the ,good guys' making great sites for users, not just algorithms, to see their effort rewarded.''} (vgl. Cutts 2012b).

